Логин
 
 
 
 

Статьи и обзоры



 
 
XI Форум Auto-ID & Mobility - решения для бизнеса

Искусственный интеллект расшифрует аудиозапись в мобильном приложении VK

09.06.2020

ВКонтакте создала технологию, благодаря которой пользователям больше не придётся слушать голосовые сообщения — их можно будет прочитать

За распознавание речи отвечает новая нейросеть, созданная командой исследований ВКонтакте. В отличие от остальных, она учитывает высокую нагрузку платформы, а также русскоязычный сленг и сложные условия записи.

Функция работает в мобильном приложении VK и уже доступна части пользователей, а у всех появится в ближайшую неделю. Распознавать можно как полученные, так и отправленные голосовые сообщения длительностью до 30 секунд — это 90% от всех аудио, которые записывают при общении ВКонтакте. Более того, новая технология поможет вернуться к нужной информации в переписке: голосовые сообщения теперь можно находить при помощи поиска по тексту. В будущем функция распознавания появится в версии для компьютера, а расшифровать можно будет как более длинные, так и пересланные сообщения.

Голосовые сообщения — очень популярный формат общения ВКонтакте. Ежемесячно аудиосообщениями обмениваются 30 миллионов пользователей, поэтому новая технология VK рассчитана на самые высокие нагрузки. При этом нейросеть расшифровывает записи быстрее, чем человек, хорошо понимает разговорный язык и заимствованную лексику, а также справляется с аудио низкого качества и нечёткой речью.

Павел Калайдин, директор по исследованиям в области искусственного интеллекта ВКонтакте:
«Расшифровка аудиосообщений — уникальная и по-своему интересная задача, которая значительно отличается, например, от распознавания речи в голосовых помощниках. С другом в чате общаются совсем не так, как с умной колонкой: сообщения записываются на бегу с посторонними шумами, большим количеством сленга и сокращений. Нейросеть должна не просто понять речь, но и сформулировать связный текст. Поэтому на самом деле мы сделали три нейросети: одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания. Вместе они станут самым высоконагруженным сервисом по распознаванию речи на русском языке».

Распознавание голосовых сообщений полностью автоматизировано и проводится при помощи методов искусственного интеллекта. Сотрудники ВКонтакте и любые другие сторонние лица не обладают доступом к личным сообщениям пользователей. Голосовые — не исключение. Чтобы собрать данные для обучения, участники программы VK Testers записывали специально подготовленные фразы. Также качество распознавания оценивалось с помощью обратной связи от тестировщиков.

ВКонтакте начала тестировать функцию распознавания голосовых сообщений в марте. Ранее VK представила нейросеть, генерирующую новостные заголовки, внедрила модели машинного обучения в модерацию контента и определение тематики публикаций, а также открыла в МФТИ собственную лабораторию искусственного интеллекта.

Источник:  Пресс-служба VK


Рейтинг статьи

Возврат к списку



Материалы по теме:

Статьи и обзоры
Новости рынка и технологий

Продукты автоматической идентификации

Chainway URA4
Chainway URA4
4-портовый стационарный UHF RFID-считыватель на базе ОС Android 9.0
DASCOM DC-7600
DASCOM DC-7600
Карточный принтер с технологией ретрансферной печати
Chainway C72 UHF RFID
Chainway C72 UHF RFID
Мобильный UHF RFID считыватель на ОС Android
RST-BOOKOS
RST-BOOKOS
Настольный UHF RFID считыватель для библиотек, предприятий и складов
DASCOM DC-2300
DASCOM DC-2300
Компактный принтер для печати карт с технологией прямой термопечати
Chainway MC21
Chainway MC21
Терминал сбора данных промышленного класса
Chainway P100
Chainway P100
Высокопроизводительный промышленный планшет с поддержкой 5G
UHF RFID метка TwinTag
UHF RFID метка TwinTag
UHF RFID метка для маркировки широкого спектра товаров в розничной торговле
DASCOM DP-641
DASCOM DP-641
Мобильный принтер этикеток

Все продукты >>>

 
XI Форум Auto-ID & Mobility - решения для бизнеса

Проекты и решения

События

Опрос





Комментарии